targets::tar_make()Proyecto Paraná 2023
Introducción
Este documento funciona como soporte del proyecto Estimar indicadores de calidad de agua en la cuenca media del río paraná para el desarrollo de un algoritmo mediante técnicas de teledetección satelital (MSECRE0008604), desarrollado por el Grupo de Investigación Sobre Temas Ambientales y Químicos (GISTAQ) de la Universidad Tecnológica Nacional Facultad Regional Resistencia.
A continuación se describen el objetivo general (1) y específicos del presente proyecto. Se detallan las tareas que se ejecutan para la obtención, extracción y almacenamiento de datos espectrales y fisicoquímicos (2). Luego, se describe la metodología de los muestreos (3). Los resultados (4) incluyen las relaciones entre parámetros y la evolución de estos. Se visualizan las firmas espectrales por sitio y por muestreo (5). Finalmente, se describen el desarrollo y selección de algoritmos (6).
La finalidad de este desarrollo es reunir en un único sitio web las características principales del proyecto, registrar datos, visualizar resultados y evaluar algoritmos.
En particular, este documento sirve como una guía para entender cómo se obtienen los datos pertinentes al proyecto de investigación, visualizar resultados, evaluar algoritmos y como material de consulta general de la metodología.
1 Objetivo
El objetivo principal del proyecto de investigación es:
Los objetivos específicos son:
Seleccionar un sector de la cuenca media del río Paraná, en la confluencia delos ríos Paraguay-Paraná, y en la toma de agua de la empresa potabilizadora de la ciudad de Resistencia.
Definir la cantidad y ubicación geográfica de los sitios de muestreo considerando el sensor satelital elegido, la logística y las características de la región de interés.
Analizar los sólidos suspendidos y la turbidez como indicadores de la calidad del agua en las muestras recolectadas en los sitios previamente seleccionados.
Construir una base de datos espaciotemporales a partir de productos satelitales ópticos, en reflectancia de superficie.
Calcular índices espectrales relacionados con la cuantificación delos indicadores de calidad del agua.
Desarrollar un algoritmo semiempírico que permita estimar indicadores de la calidad del agua a partir delos datos de campo y los datos espectrales de los productos espaciales.
Validar el algoritmo desarrollado, evaluar su significancia estadística y compararlo con otros encontrados en referencias bibliográficas.
Generar mapas de los parámetros estimados y su evolución temporal a partir de la aplicación del algoritmo obtenido.
Analizar espaciotemporalmente el comportamiento de los indicadores de calidad de agua.
Formar RRHH en el área específica.
El desarrollo de algoritmos empíricos requiere de datos espectrales y fisicoquímicos del agua, la propuesta de modelos candidatos, la selección final de los modelos y la validación de los mismos. Luego, la generación de mapas para evaluar la distribución espacial de las propiedades.
Se pretende automatizar la descarga, extracción y almacenamiento de los datos espectrales y fisicoquímicos del agua en los sitios de muestreo, junto con las coordenadas geográficas.
A medida que el proyecto avance los resultados parciales serán registrados en el presente sitio web, para su seguimiento y revisión por parte de los integrantes.
2 Ejecución
El proyecto está gestionado mediante targets. Para ejecutar todas las funciones, correr en la consola:
Esto genera una ejecución en cadena de múltiples funciones que permiten la obtención de datos espectrales y fisicoquímicos para la generación y almacenamiento de resultados.
Utilizar targets permite asegurar el orden correcto de ejecución y facilita la resolución de potenciales problemas.
2.1 Funciones
El archivo _targets.R contiene los paquetes necesarios y las funciones a ejecutar, en el orden adecuado y las relaciones entre sí.
Para visualizar las dependencias y el estado actual entre funciones correr:
targets::tar_visnetwork()A continuación, se describen las funciones objetivo.
2.1.1 excel
El archivo Excel datos/datos_gistaq.xlsx contiene todos los datos del muestreo y los resultados de los análisis fisicoquímicos.
Incluye la fecha, las coordenadas geográficas de los sitios de muestreo, los valores de pH, conductividad (μS/cm), profundidad de disco de Secchi (cm), sólidos suspendidos (mg/L) y turbidez, por dos métodos: colorimétrico (HATCH, NTU) y turbidímetro (Hazemeter, EBC).
Luego de cada muestra de agua (3) es procesada, se actualiza manualmente este archivo con los datos obtenidos. Modificando este archivo, al ejecutar la función vista al inicio de esta sección (2), se suceden todas las funciones.
2.1.2 fecha_descarga
A partir de las fechas ya previamente analizadas, sacadas de la base de datos, se obtiene del archivo Excel, la última fecha faltante.
A partir de esta fecha se procede a la descarga del producto correspondiente.
2.1.3 script_py
Usando la plantilla scripts/plantilla.py de un código de programación en Python, se genera el archivo scripts/d.py que contiene los parámetros de búsqueda del producto de interés.
Se establecen las coordenadas de la región de interés (-58° 48’ 48
S, 27° 29’ 18
O), la fecha (2.1.2) y el nivel de procesamiento.
2.1.4 producto_zip
Se ejecuta el script Python que descarga el producto. Utiliza las credenciales de mi cuenta en Copernicus Data Space Ecosystem. El nivel de procesamiento es L2A, en reflectancia de superficie, con corrección atmosférica automática.
El producto a descargar corresponde al SAFE y se encuentra comprimido en un archivo .zip. El tamaño del producto es 1Gb aproximadamente.
2.1.5 recorte_tif
Extracción del contenido del .zip y creación de un stack a partir de las bandas de interés.
El stack contiene las bandas espectrales: B01, B02, B03, B04, B05, B06, B07, B08, B8A, B11 y B12. Se recorta al polígono vector/recorte_puente.gpkg y luego se hace un remuestreo a 10 m. Las características de estas bandas se detallan en la tabla 1.
Se almacena el recorte .tif, siendo el nombre del archivo la fecha de adquisición del producto.
2.1.6 datos_gis
A partir de la fecha (2.1.2), se genera un vector con las coordenadas geográficas del Excel (2.1.1). Luego, se extraen los valores de píxeles por cada banda. Se actualiza el archivo datos/base_de_datos_gis.csv (2.2.1) con los nuevos datos espectrales.
Las características de las bandas espectrales se muestran a continuación:
| Banda |
Resolución espacial (m) |
Sentinel-2A | Sentinel-2B | ||
|---|---|---|---|---|---|
| Longitud de onda (nm) |
Ancho de banda (nm) |
Longitud de onda (nm) |
Ancho de banda (nm) |
||
| B01 | 60 | 442,7 | 20 | 442,3 | 20 |
| B02 | 10 | 492,7 | 65 | 492,3 | 65 |
| B03 | 10 | 559,8 | 35 | 558,9 | 35 |
| B04 | 10 | 664,6 | 30 | 664,9 | 31 |
| B05 | 20 | 704,1 | 14 | 703,8 | 15 |
| B06 | 20 | 740,5 | 14 | 739,1 | 13 |
| B07 | 20 | 782,8 | 19 | 779,7 | 19 |
| B08 | 10 | 832,8 | 105 | 832,9 | 104 |
| B8A | 20 | 864,7 | 21 | 864 | 21 |
| B09 | 60 | 945,1 | 19 | 943,2 | 20 |
| B10 | 60 | 1373,5 | 29 | 1376,9 | 29 |
| B11 | 20 | 1613,7 | 90 | 1610,4 | 94 |
| B12 | 20 | 2202,4 | 174 | 2185,7 | 184 |
2.1.7 datos_lab
Los datos fisicoquímicos del Excel se extraen a partir de la fecha y se combinan con los datos ya presentes en el archivo datos/base_de_datos_lab.csv.
2.2 Datos
Los datos generados son del tipo archivo de texto (.csv) y ráster (.tif).
2.2.1 Bases de datos
La ejecución de targets tiene como propósito (1) la obtención de los datos espectrales y fisicoquímicos de los sitios de muestreo sobre el río Paraná.
- Datos espectrales,
datos/base_de_datos_gis.csv
El archivo de texto posee los valores de reflectancia de superficie (entre \(0 - 1\)) para cada banda de S2-MSI. Se generan dos valores para cada sitio: 1x1, que consiste en el valor exacto del píxel; y 3x3, que toma la media de una ventana de píxeles alrededor del píxel central.
Se incluye la fecha, el número de sitio y las coordenadas geográficas en el sistema EPSG:4326, en latitud y longitud.
- Datos fisicoquímicos,
datos/base_de_datos_lab.csv
Sobre el curso de agua se obtienen pH, conductividad, profundidad de disco de Secchi y las coordenadas geográficas. En laboratorio se miden turbidez por dos métodos: colorimétrico (HACH) y turbidímetro (Hazemeter), y sólidos suspendidos por gravimetría.
2.2.2 Recortes ráster
Los productos S2-MSI son recortados a la región de interés, alrededor del Puente Chaco-Corrientes.
Se genera un stack con las bandas de interés (2.1.6) y se almacena con el nombre de la fecha correspondiente en la carpeta recorte/ con formato .tif.
2.3 Creación de objetivos
Para generar nuevos objetivos, hay que editar el archivo _targets.R agregando un nuevo elemento a list():
targets::tar_target(
names = nombre_de_objetivo,
command = funcion()
)La funcion() se desarrolla en el archivo scripts/funciones.R. En caso de hacer el seguimiento de archivos agregar el argumento format = "file".
2.4 Entorno de ejecución
Definir las versiones de los paquetes utilizados en el presente proyecto es relevante ya que permite asegurar la reproducibilidad de los resultados. Para tal fin se emplea el paquete renv.
La instalación de paquetes se realiza de manera tradicional con install.packages("nombre_de_paquete"). Cada vez que se instale, actualice o remueva un nuevo paquete ejecutar en la consola:
renv::snapshot()Esto actualiza el archivo renv.lock con la información de cada paquete. Para verificar el estado actual de renv, correr:
renv::status()2.5 Quarto
El presente sitio web fue desarrollado con la herramienta Quarto. Para generar el sitio web se debe renderizar el archivo index.qmd que produce index.html.
La publicación se lleva a cabo en Quarto Pub. Los datos de publicación se registran en el archivo _publish.yml.
Para regenerar el .html e inmediatamente publicar el sitio web, correr en la terminal:
quarto publishEn la terminal se debe elegir la cuenta asociada a Quarto Pub.
3 Muestreos
Los muestreos, según lo permita la logística, se llevan a cabo cada fecha de adquisición de S2-MSI, cada 5 días sobre la región de interés, con cielo despejado. El plan de adquisición actualizado puede descargarse en formato .kml.
En cada fecha se toman 8 muestras de agua sobre una transecta a lo largo del río Paraná. Los sitios son aproximadamente equidistantes entre sí y con las orillas.
La fecha actual y los siguientes 10 muestreos son:
| Fecha | Día |
|---|---|
| 2024-06-14 | Viernes |
| 2024-06-14 | Viernes |
| 2024-06-19 | Miércoles |
| 2024-06-24 | Lunes |
| 2024-07-04 | Jueves |
| 2024-07-09 | Martes |
| 2024-07-19 | Viernes |
| 2024-07-24 | Miércoles |
| 2024-07-29 | Lunes |
| 2024-08-08 | Jueves |
| 2024-08-13 | Martes |
Las muestras de agua se toman en botellas de vidrio color caramelo de 1 litro y se registra la posición geográfica del sitio.
Sobre el agua se miden pH, conductividad y profundidad de disco de Secchi. Luego, en el laboratorio se miden turbidez y sólidos suspendidos. A continuación, se describen cada uno:
pH y conductividad (μS/cm), a partir de un equipo multiparamétrico.
Profundidad de disco de Secchi (cm).
Sólidos suspendidos (ppm) por método gravimétrico, utilizando el método estandarizado 2540 D, que emplea filtros de 47 mm de diámetro y 0,5 μm de poro.
-
Turbidez se obtiene a partir de dos métodos:
- Colorimétrico (NTU), utilizando el equipo HACH, programa 95.
- Turbidímetro (EBC), que emplea el Hazemeter.
La relación entre las unidades de turbidez es: \(1~NTU = 0,25~EBC\).
4 Resultados
Se muestran las correlaciones lineales entre los parámetros espectrales y fisicoquímicos. De estos últimos se incluye la serie temporal según el sitio de muestreo.
Las firmas espectrales se encuentran en la siguiente sección (5).
4.1 Datos fisicoquímicos
Tabla de coeficientes de correlación lineal R (Pearson) entre pares de parámetros fisicoquímicos, y los valores se acomodan como una matriz triangular para evitar repeticiones.
| pH | Cond (μS/cm) |
Sól. susp. (ppm) |
Turb (NTU) |
|
|---|---|---|---|---|
Cond |
-0,289 |
— | — | — |
Sól. susp. |
-0,216 |
0,963✦ |
— | — |
Turb |
-0,113 |
0,843✦ |
0,829✦ |
— |
SDD |
-0,173 |
-0,408✦ |
-0,635✦ |
-0,697✦ |
| ✦ : |R| > 0,5 R : p-valor < 0,05 |
||||
Las correlaciones mostradas en la tabla anterior (3) pueden visualizarse en las siguientes figuras. La línea punteada corresponde al mejor ajuste lineal para cada par de parámetros.
Las siguientes figuras muestran la evolución de los datos fisicoquímicos por sitio muestral y fecha.
4.2 Datos espectrales
Coeficientes de correlación lineal de Pearson entre reflectancias de superficie de las bandas espectrales (tabla 1) de S2-MSI.
| B01 | B02 | B03 | B04 | B05 | B06 | B07 | B08 | B8A | B11 | |
|---|---|---|---|---|---|---|---|---|---|---|
B02 |
0,952✦ |
— | — | — | — | — | — | — | — | — |
B03 |
0,830✦ |
0,937✦ |
— | — | — | — | — | — | — | — |
B04 |
0,520✦ |
0,652✦ |
0,833✦ |
— | — | — | — | — | — | — |
B05 |
0,475✦ |
0,583✦ |
0,747✦ |
0,980✦ |
— | — | — | — | — | — |
B06 |
0,664✦ |
0,729✦ |
0,803✦ |
0,916✦ |
0,948✦ |
— | — | — | — | — |
B07 |
0,665✦ |
0,720✦ |
0,784✦ |
0,900✦ |
0,940✦ |
0,998✦ |
— | — | — | — |
B08 |
0,663✦ |
0,722✦ |
0,780✦ |
0,892✦ |
0,931✦ |
0,995✦ |
0,997✦ |
— | — | — |
B8A |
0,842✦ |
0,877✦ |
0,883✦ |
0,831✦ |
0,837✦ |
0,956✦ |
0,955✦ |
0,953✦ |
— | — |
B11 |
0,955✦ |
0,945✦ |
0,867✦ |
0,535✦ |
0,466✦ |
0,644✦ |
0,635✦ |
0,632✦ |
0,831✦ |
— |
B12 |
0,951✦ |
0,940✦ |
0,863✦ |
0,532✦ |
0,462✦ |
0,638✦ |
0,630✦ |
0,627✦ |
0,826✦ |
0,999✦ |
| ✦ : |R| > 0,5 R : p-valor < 0,05 |
||||||||||
4.3 Sitios muestrales
Se muestran los sitios de muestreo para todas las fechas disponibles junto con la imagen en composición de color real correspondiente.
Actualmente se realizaron 4 muestreos, en los que se recolectaron 32 muestras de agua.
En todos los casos, no se aprecia presencia de nubes sobre los puntos de toma de muestras.
Los ocho sitios muestrales se nombran correlativamente de P1 a P8, iniciando en la provincia del Chaco con y finalizando en la provincia de Corrientes.
5 Firmas espectrales
A partir de los valores de píxel de las reflectancias de superficie (2.2.1) se construyen firmas espectrales, que permiten inferir las características del agua. Las firmas espectrales a lo largo de la transecta en el río Paraná sirven para ver el cambio entre costas.
Firmas espectrales por fecha y sitio muestral a lo largo de una línea transecta.
Las curvas color azul corresponden a los sitios cercanos a la orilla chaqueña. Los puntos cercanos a la costa correntina son de color rojo.
Generalmente, las firmas espectrales del lado chaqueño presentan los mayores valores. A medida que los sitios de muestreo se acercan al lado correntino, las firmas espectrales comienzan a aplanarse.
6 Algoritmos
El desarrollo de los algoritmos para la estimación de indicadores de calidad del agua requiere la combinación de datos espectrales y fisicoquímicos.
Se proponen múltiples modelos para la estimación de parámetros. Se siguen los lineamientos de tidymodels para el entrenamiento y validación de los modelos.
Contacto
Sitio web desarrollado y mantenido por: Mgtr. Víctor Gauto .
Grupo de Investigación Sobre Temas Ambientales y Químicos (GISTAQ) , , .
14/06/2024 10:07